Tehnica uimitoare prin care ar putea fi rezolvate problemele de auz

de: Ozana Mazilu
18 03. 2021

Pentru mulți oameni cu deficiențe de auz, o conversație normală la un restaurant aglomerat este Sfântul Graal. Iată cum îi ajută inteligența artificială.

„Zgomotul de fundal este problema principală care trebuie rezolvată”, a spus Abram Bailey, un fost audiolog practicant care conduce acum Hearing Tracker, o platformă online populară.

De când aparatele auditive digitale au devenit disponibile acum un sfert de secol, calitatea audio a acestora în situații complexe a avansat grație unor dezvoltări precum microfoane direcționale și setări preprogramate pentru medii de sunet comune.

Însă duelul de noi intrări pe piață – unul de la marca daneză consacrată Oticon și altul de la startup-ul californian Whisper – încearcă să facă un salt mai mare folosind inteligența artificială pentru a face mediile zgomotoase mai clare ca niciodată.

Deși alte companii folosesc AI în părți ale aparatelor auditive sau aplicațiilor lor, noile produse Whisper și Oticon folosesc rețele neuronale profunde instruite pe seturi de date gigantice, pentru a izola și a clarifica sunetele potrivite pentru persoanele cu hipoacuzie.

Din toate punctele de vedere, tehnologia are promisiuni mari pentru aparatele auditive. Învățarea automată care alimentează deja tehnologiile pe care le folosim în fiecare zi și în setări de laborator controlate poate realiza fapte impresionante de clarificare a sunetului. Dar progresul se poate mișca mai încet în lumea tehnologiei auditive.

Inteligența artificială a fost încorporată în aparatele auditive

„Tuturor ne-ar plăcea să avem o tehnologie avansată, dar chiar și tehnologiile avansate tind să se bazeze pe schimbări incrementale”, a spus Todd A. Ricketts, profesor și vicepreședinte la Departamentul de Auz și Vorbire al Vanderbilt. El a adăugat: „Ceea ce am putea vedea din prima generație de rețele neuronale profunde sunt poate mici îmbunătățiri”.

Ca să nu mai vorbim de Dwight Crow, CEO și cofondator al Whisper, care și-a lansat primul sistem auditiv în toamna anului trecut. Compania de trei ani are ochii ațintiți pe tipurile de salt cuantic despre care Ricketts spune că sunt incredibil de rare.

Abordarea lui Whisper este fascinantă atât datorită designului neconvențional, cât și a rădăcinilor sale din Silicon Valley. Fondatorii săi au lucrat la Facebook, are recruți de la Google, iar compania este alimentată de finanțarea de la Sequoia și alte firme de capital de risc cunoscute.

Acolo unde aparatele auditive tradiționale sunt constrânse de bateriile și procesoarele care pot încăpea într-o capsulă mică ascunsă în spatele urechii cuiva, sistemul auditiv Whisper folosește o mică cutie externă de procesare pe care compania o numește „creierul”. Microfoanele de pe aparatele auditive trimit semnal audio wireless către creier de sute de ori pe secundă, unde este procesat și trimis înapoi.

Potrivit lui Crow, limitarea dimensiunilor unui aparat auditiv tradițional permite companiei să ruleze algoritmi care necesită mult mai multă putere de calcul pentru a finaliza în timp real. Rezultatul, susține compania, este capacitatea de a izola mai bine sunetele dorite, cum ar fi vorbirea, și de a le ridica mai precis decât ceea ce era posibil fără inteligența artificială.

Cum funcționează această tehnologie

Până în prezent, Whisper poate descrie doar beneficiile în ceea ce privește potențialul de calcul, susținând că creierul Whisper poate efectua 300 de miliarde de operații pe secundă, comparativ cu aproximativ un miliard al concurenței.

„Persoanele cu aparate auditive au o istorie a adoptării accesoriilor pentru a auzi mai bine”, a spus Crow, arătând spre tehnologia Bluetooth. Înainte de a fi încorporat direct în aparate auditive, mulți oameni purtau un colier electronic pentru a face posibilă conexiunea fără fir cu telefoanele.

„Aș vedea cel puțin un deceniu în care a avea un dispozitiv auxiliar îți va transforma capacitatea de a auzi clar”, a spus el.

Într-un alt avantaj potențial, caseta face posibilă, de asemenea, companiei să emită actualizări de software. Whisper a anunțat recent prima sa actualizare, despre care compania susține că îmbunătățește „motorul de separare al sunetului”. Deocamdată, actualizarea trebuie efectuată de un audiolog, dar Crow a spus că compania speră că viitoarele actualizări pot fi făcute de utilizator.

La scurt timp după ce Whisper a început să își lanseze sistemul în toamna anului trecut, Oticon More a lansat, folosind un algoritm de deep learning similar, instruit pe 12 milioane de sunete.

 „Scopul din spatele rețelei neuronale este de a prelua sunetele și de a le face în mod esențial echilibrate și exacte, astfel încât acestea să sune exact așa cum sunt destinate să sune în acel mediu”, a spus Annette Mazevski, manager de evaluare la Oticon.

Winn a spus că calitatea sunetului aparatului auditiv a parcurs un drum incredibil de lung și că „cerul este limita tehnologiei”.